Investigadores de Meta y Stanford proponen un Transformador Latente de Bytes rápido que reduce el ancho de banda de memoria de inferencia en más del 50% sin tokenización
<meta content=Meta y Stanford crean un transformador de bytes latente que reduce más del 50% el ancho de banda de memoria sin tokenización. Descubre esta innovación en IA.>